Третий семестр
Результат работы представлен в таблице:
Аминокислотный остаток в 4-ой позиции белка GLMU_ECOLI | N | ||||
Соответствующий кодон в гене glmU | 5'-AAU-3' | ||||
Идеальный антикодон | 5'-AUU-3' | ||||
Сколько можно было бы ожидать разных тРНК для остатка N, если опираться на генетический код? | 2 | ||||
Сколько разных тРНК для остатка N аннотировано в геноме кишечной палочки? | 1 TRNA, для нее приведено 4 разных гена | ||||
имя гена | локализация гена в геноме | распознаваемый кодон | антикодон | ||
Характеристика аспарагиновой тРНК: | asnT | 2042573..2042648; локус - b1977 | AAY | GUU | |
asnW | complement(2056051..2056126); локус - b1984 | AAY | GUU | ||
asnU | 2057875..2057950; локус - b1986 | AAY | GUU | ||
asnV | 2060284..2060359; локус - b1989 | AAY | GUU | ||
Результат поиска всех аспарагиновых
тРНК у Escherichia coli K-12 FT /note="codons recognized: AAY; anticodon: GUU asparagine FT /note="codons recognized: AAY; anticodon: GUU asparagine FT /note="codons recognized: AAY; anticodon: GUU asparagine FT /note="codons recognized: AAY; anticodon: GUU asparagine |
Использованные команды:
1. grep codon.*asparagine ecoli.embl >codon.txt
2. seqret ecoli.embl -sask
Получен файл с последовательностью тРНК (в качестве параментров указывались координаты и имя выходного файла).
Задание - найти в геноме Bacillus subtilis последовательность, наиболее похожую на последовательность тРНК из E.coli. Поиск проводился с помощью 4-х разных программ для быстрого поиска сходных нуклеотидных последовательностей.
Результаты поиска
Программа | FASTA | BLASTN | MegaBLAST | discontiguous MegaBLAST |
Длина якоря (нуклеотиды) | 6 | 11 | 28 | 11 (или 12) |
Результаты поиска | result_fasta Приведены 5 выравниваний с фрагментами полного генома Bacillus subtilis | result_blastnт.к. длина выравниваний мала. нашлись случайные находки | result_megablastнет находок | result_dmblastрезультаты поиска схожи с результатами для BLASTN |
Число находок с E-value < 0,01 | 1 | 0 | - | 0 |
Характеристика лучшей находки: | ||||
E-value | 1.7e-06 (AC Z99104) | 0.21 (АС Z99113) | - | 0.20 (АС Z99113) |
длина выравнивания | 65 | 15 | - | 15 |
вес выравнивания | 178.4 | 30.2 | - | 30.2 |
координаты в геноме | 11466..11530 | 39866..39880 | - | 39866..39880 |
Аннотация лучшей находки по записи EMBL: | ||||
имя гена | trnO-Ile | pksN | pksN | |
это тРНК? | да | нет | - | нет |
это тоже аспарагиновая; тРНК? | нет | - | \- | - |
Использованные команды:
formatdb -i bs_genome.fasta -n bs -p F
Были получены три индексных файла (bs.nhr, bs.nsq, bs.nin), составляющих мини-банк данных.
blastall -p blastn -d bs -i tRNA.fasta -o result-bs.txt
Получен файл с одной находкой с высоким E-value.
megablast -d bs -i tRNA.fasta -D 2 -o megblast.txt
Получен файл, не содержащий находок.
megablast -d bs -i tRNA.fasta -D 2 -N 1 -W 11 -t 16 -o dismegablast.txtСначала была установлен паттерн длиной в 21 символ. Был получен файл без находок. При ослаблении паттерна до 16 символов результат поиска не улучшился.
fasta34 tRNA.fasta bs_genome.fasta 6
Длина якоря - 6. Входные файлы были указаны в командной строке, поэтому нужно было ответить на четыре вопроса: сколько находок показать, показать ли ещё, отображать ли выравнивания и сколько. Получен файл с 4 находками и одним единственным значимым выравниванием.
Сравнение эффективности использованных программ.
С заданием не справилась ни одна из программ. FASTA нашла тРНК, но изолейциновую. Программы MEGABLAST и discontiguous MegaBLAST нашли случайные находки, короткие последовательности, кодирующие белки. Результаты поиска не улучшаются и при ослаблении паттерна.